(Mengder og tupler)=
### Mengder og tupler

Lister er samlinger av objekter. 

Det er mengder og tupler ogs√•, men de er litt forskjellige fra lister.

#### Tupler
Tupler (*tuples*), som lister, har en tydelig rekkef√∏lge, men **en tuppel skal ikke kunne endres**.

Vi skriver tupler med parantes `(1, 2, 3)`, i stedet for klammeparantes `[1, 2, 3]`.

In [13]:
a = [1, 2, 3] # Liste
b = (1, 2, 3) # Tuppel

print(type(a))
print(type(b))

<class 'list'>
<class 'tuple'>


Tupler er ofte brukt til punkter og vektorer som ikke skal endre seg i et program.

(Mengder)=
#### Mengder
En mengde (*set*) er en m√•te √• samle forekomster av objekter **uten rekkef√∏lge** og **uten gjentagende elementer**.

- Vi kan lage en **tom mengde** ved √• skrive `a = set()`
- Vi kan gj√∏re en liste om til en mengde ved √• skrive `a = set(<liste>)`
- Vi kan ogs√• bruke *kr√∏llparanteser*, men ikke for √• lage en tom mengde.

In [15]:
a = set()
b = set([1, 2, 3])
c = {}
d = {1, 2, 3}

print(type(a))
print(type(b))
print(type(c))
print(type(d))

<class 'set'>
<class 'set'>
<class 'dict'>
<class 'set'>


Vi ser at `c` blir tolket som en `dict`, en ordbok, ikke en mengde. Vi m√• bruke `set()` for √• lage en tom mengde.

##### Legge til og fjerne objekter

Vi kan legge til og fjerne objekter ved √• bruke `add()`- og `remove()`-metodene. 

In [16]:
a = set([1])
print(a)

a.add(4)
print(a)

a.remove(4)
print(a)

{1}
{1, 4}
{1}


Vi kan ikke legge til flere av samme objekt.

In [17]:
a = set([1, 2, 3])
print(a)

a.add(1)
print(a)

{1, 2, 3}
{1, 2, 3}


##### Finne unike objekter i en liste

Vi kan finne alle *unike* objekter i en liste eller string ved √• konvertere til en mengde.

In [18]:
tekst = "ü¶†üí∏ü¶†üìóüçèüíöüíöüíöü•¶ü•¨ü•¨ü•¨ü•¨ü•íü´ëü´ëüìóüü¢üü¢üí∏üí∏üü©üçèüíöü•¶üëΩü•¨ü•¨ü•¨ü•¨ü•íü•íü´ëüü¢üü©üìó"

mengde = set(tekst) # Konverterer listen til en mengde

print(mengde)
print(f"Det finnes {len(mengde)} forskjellige emojis i teksten.")

{'üü¢', 'ü•¶', 'üü©', 'ü•¨', 'üìó', 'ü•í', 'üëΩ', 'üçè', 'üíö', 'ü¶†', 'ü´ë', 'üí∏'}
Det finnes 12 forskjellige emojis i teksten.


##### Union og snitt

Du har sikkert sett et venndiagram f√∏r.

```{image} ../_images/venndiagram.png
:alt: Figur av et venndiagram.
```

Mengden $A$ best√•r av masse objekter. Det gj√∏r ogs√• mengde $B$. Noen elementer er til felles for disse, og dette kalles for *snittet* eller $A \cap B$. Her er noen andre ting fra mengdeteori som er interessant for oss.

::::{grid} 3
:gutter: 1

:::{grid-item-card} Objekter
:::

:::{grid-item-card} Matematisk
:::

:::{grid-item-card} Pythonsk
:::

:::{grid-item-card}
Objekter som er i $A$ eller $B$. Alle objekter.
:::

:::{grid-item-card}
$A\cup B$. 

$A$ *union* $B$.
:::

:::{grid-item-card}
`A | B`
:::

:::{grid-item-card}
Objekter som er i *b√•de* $A$ og $B$.
:::

:::{grid-item-card}
$A\cap B$. 

$A$ *snitt* $B$.
:::

:::{grid-item-card}
`A & B`
:::

:::{grid-item-card}
Objekter som bare er i $A$, ikke $B$.
:::

:::{grid-item-card}
$A$ \ $B$
:::

:::{grid-item-card}
`A - B`
:::

:::{grid-item-card}
Objekter som bare er i $B$, ikke $A$.
:::

:::{grid-item-card}
$B$ \ $A$
:::

:::{grid-item-card}
`B - A`
:::

::::

Mengdene over kan vi f√• bruk for i Python.

In [4]:
A = {1, 2, 3, 4}
B = {3, 4, 5, 6}

print(f"A union B: {A | B}") # eller A.union(B)
print(f"A snitt B: {A & B}") # eller A.intersection(B)
print(f"A uten B:  {A - B}") # eller A.difference(B)
print(f"B uten A:  {B - A}") # eller B.difference(A)

A union B: {1, 2, 3, 4, 5, 6}
A snitt B: {3, 4}
A uten B:  {1, 2}
B uten A:  {5, 6}


---

#### Oppgaver

````{admonition} Oppgave 1 üòç
:class: task 

Under er to strings, `a` og `b`

``` 
a = "üòéüòãüòéüòÜüòâüòâüòâüòâüòâüòäüòäüòãüòÜüòòüòÖüòòüòÜüòâüòãüòâüòãüòÖüòçüòâüòãüòéüòçüòÜüòãüòÜüòâüòçüòâüòâüòÖüòòüòÖüòãüòÖüòäüòãüòéüòéüòÖüòòüòçüòçüòòüòÜüòéüòãüòÜüòçüòçüòâüòòüòâüòÖüòçüòòüòâüòÜüòãüòÜüòâüòäüòÜüòâüòéüòÖüòòüòÜüòãüòäüòäüòâüòâüòéüòÜüòãüòçüòÖüòäüòÖüòÜüòÖüòÜüòòüòãüòÖüòÜüòéüòäüòéüòòüòòüòçüòâüòäüòç"
b = "ü•≤ü•∞ü•≤üòçüòòüòöü•≤üòôüòôüòòüòöüòòüòçü•≤üòçüòóü•≤üòòüòôüòóüòôü•∞ü•≤üòòüòòüòòü•≤üòöüòòü•≤ü•∞üòóüòöü•∞üòòüòôüòöüòçüòôüòöüòóüòôü•≤üòóüòôüòöü•∞üòöüòôüòòü•≤üòôü•∞ü•∞ü•≤ü•≤ü•∞ü•≤üòöü•≤ü•∞üòóü•∞ü•∞üòôüòòüòôü•∞ü•∞üòóü•≤üòçüòòüòòüòóü•∞üòöüòöü•≤üòòüòôüòçü•∞ü•∞ü•∞üòóüòôüòôüòòüòöüòóüòöüòöü•∞üòòüòöü•∞ü•∞üòòüòò"
```

1. Finn alle emojis som finnes i b√•de `a` og `b`.
2. Finn alle emojis i begge tekstene.
3. Finn alle emojis som bare finnes i `a`.
4. Finn alle emojis som bare finnes i `b`.

```{admonition} Fasit
:class: note, dropdown
1. `{'üòò', 'üòç'}`
2. `{'üòò', 'üòÜ', 'üòâ', 'üòÖ', 'üòç', 'üòé', 'üòä', 'üòö', 'üòã', 'ü•≤', 'ü•∞', 'üòô', 'üòó'}`
3. `{'üòÜ', 'üòâ', 'üòÖ', 'üòé', 'üòä', 'üòã'}`
4. `{'üòö', 'ü•≤', 'ü•∞', 'üòô', 'üòó'}`
```
````

```{admonition} Oppgave 2 ‚úçÔ∏è
:class: task


Lag en funksjon `unike_ord()` som tar inn en string `setning` og returnerer hvor mange *unike* ord det er i setningen.

Store og sm√• bokstaver skal ikke skille ordene. `"Ord"` er det samme som `"ord"`.

```

```{admonition} Oppgave 3 ‚öñÔ∏è
:class: task

Lag en funksjon `like_ord()` som tar inn to strings, `setning1` og `setning2`, og returnerer en liste over alle ordene som finnes i begge setningene.

Store og sm√• bokstaver skal ikke skille ordene. `"Ord"` er det samme som `"ord"`.
``` 

(romeo_og_julie_1)=
`````{admonition} Oppgave 4 üåπ
:class: task

Shakespeares fortelling om den forbudte forelskelsen mellom Romeo Montague og Juliet Capulet er en rivende kj√¶rlighetshistorie med mange dramatiske vendinger.

Last ned filen {download}`romeo_and_juliet.txt`

**Finn ut hvor mange unike ord det er i hele tekstfilen.**

- Sm√• og store bokstaver teller ikke som forskjellige ord.
    - `"Word"` telles som det samme ordet som `"word"`
- Tegnene `","`, `")"`, `"("`, `"."`, `";"`, `":"`, `"_"`, `"]"`, `"["`, `"?"`, `"!"` skal ignoreres.
    - `"Word!"` telles som det samme ordet som `"Word"` og `"Word."`.

> Tekst tatt fra [Project Gutenberg (lenke)](https://www.gutenberg.org/ebooks/1513).

````{admonition} Hint
Denne listen kan v√¶re til hjelp med √• rense ordene.

```
tegn = [",", ")", "(", ".", ";", ":", "_", "]", "[", "?", "!"]
```
````

```{admonition} Fasit
:class: hint, dropdown
Jeg fant $4344$ unike ord med kravene gitt i oppgaven.

Det finnes sikkert andre, bedre m√•ter √• fjerne rare ord p√•.
```

````{admonition} L√∏sningsforslag
:class: solution, dropdown
```
def fjern_tegn(word : str) -> str:
    """Hjelpefunksjon for √• fjerne tegn som ikke er bokstaver fra ordene"""
    for tegn in [",", ")", "(", ".", ";", ":", "_", "]", "[", "?", "!"]:
        word = word.replace(tegn, "")
    return word

with open("romeo_and_juliet.txt", encoding="utf8") as file:
    words = set()
    for line in file.readlines():
        if line.strip() != "":
            for word in line.strip().split():
                words.add(fjern_tegn(word.upper()))

# Skriver ut lengden uten tomme ord ''
print(len(words - {''}))
```
````
`````